5  Análisis de redes

5.1 Insumos de la encuesta

El insumo de estos análisis es una serie de preguntas en donde cada estudiante debe elegir, entre todos los estudiantes de ese cuatrimestre, a los 5 a los que más conoce. Como tal este módulo puede considerarse como una serie de preguntas cerradas de respuesta única con la característica saliente de que esas preguntas poseen muchas opciones posibles. En efecto, las opciones son tantas como estudiantes estén cursando la materia. Desde un punto de vista metodológico lo importante no es tanto que las opciones sean muchas o pocas sino que el rango de estas es conocido y discreto.

Luego de una primera pregunta en donde el estudiante se auto identifica en la lista se pasa a otras 5 preguntas en donde el estudiante va eligiendo a otres compañeres a los cuales más conoce. Si no conoce a nadie más elige la opción “00-NO CONOZCO A NADIE MAS” en las siguientes preguntas.

pregunta_redes_1

pregunta_redes_2

La explicitación de lo anterior es importante por la siguiente razón. El análisis de redes sociales (SNA) no se suele llevar bien con la estructura de datos conocida conocida en las ciencias sociales como matriz de datos (Galtung 1973) o, más en general, como una estructura de datos “casos x variables”. Como lo suguiere esta última descripción esta es una estructura afín a lo que se suele demoninar “datos de atributos” en donde los valores de las variables se consideran atributos de cada uno de los casos. En cambio, en el SNA suele ser preferible alguna de los siguientes estructura de datos que se consideran más idóneas para representar un tipo de dato relacional (Scott 2017, cap. 4):

a) Una matriz de adyacencia (adjacency matrix) en donde las filas y las columnas son asignados para los (mismos) nodos de la red y la presencia de una relación es representada con un valor numérico. Se dice que es una matriz cuadrada y dispersa porque tiene la misma cantidad de filas y columnas y puede que muchas de sus celdas contengan un valor “0”. Se suele considerar la representación estándar de esta técnica.

b) Una lista de lazos (edge list) en donde (sólo) se “listan” todas las relaciones de la red. Es una opción que, en comparación a la opción “a”, suele ocupar menos espacio en memoria ya que sólo representa la presencia y/o intensidad de las relaciones entre los nodos. En general se trata de una estructura más larga que ancha ya que cada relación ocupa una fila y las columnas se suelen limitar (aunque no necesariamente) a algo como “origen” (from), “destino” (to) e “intensidad de la relación”.

c) Una lista de adyacencia (adjacency list) que puede considerarse un híbrido entre las opciones “a” y “b”. En este caso cada nodo se representan en una fila y cada una de ellas se “listan” todas sus relaciones con otros nodos. Dado lo anterior esta estructura tiene tantas filas como nodos pero la cantidad de columnas de cada fila es igual a la cantidad de relaciones que tenga cada nodo.

5.2 Breve introducción al análisis de redes

El análisis de redes (Network Analysis o NA) es un enfoque que tiene una larga historia dentro de las ciencias en general. En el caso más particular del Análisis de Redes Sociales (Social Network Analysis o SNA) su origen tiene 2 patas diferenciadas. Por un lado, tuvo que ver con la invención del sociograma, el cual, a su turno, tuvo que ver con el origen de la sociometría. El sociograma es una herramienta de visualización de las relaciones sociales que conforman un grupo. Para su construcción se requiere de datos de todos los miembros de ese grupo por lo que su utilización muchas veces se restringue a grupos o organizaciones pequeños. En parte por lo anterior, no son muchas las investigaciones empíricas que lo utilizan dada la dificultad metodológica de obtener esos datos.

El análisis de redes en general y el análisis de redes sociales en particular puede considerarse como una aplicación de una teoría matemática abstracta como es la teoría de grafos (Graph Theory). Esta última se origina en un clásico artículo de Leonard Euler de 1741 en donde trata el conocido problema de los siete puentes de Königsberg (Euler 1741). El problema consiste en encontrar un recorrido para cruzar a pie toda la ciudad pasando sólo una vez por cada uno de los puentes y regresando al mismo punto de inicio.

Recién luego de varias décadas la visualización del sociograma se relacionó explícitamente con la teoría de grafos, dando origen al SNA. Si los sociogramas tenían la dificultad metodológica de su construcción, con la incorporación de la teoría de grafos se sumó la dificultad metodológica del análisis de esos datos. Estas 2 condiciones todavía afectan mucho el grado de difusión de este enfoque, aunque en la actualidad tanto la huella digital contenida en la redes sociales virtuales (facebook, twitter, etc.) como la emergencia de programas informáticos que facilitan el análisis ha favorecido una mayor difusión. En parte por lo anterior, en lo que sigue se mostrará como se pueden hacer análisis y visualizaciones de redes con datos provenientes de una base original de casos x columnas.

5.3 Análisis y visualizaciones

5.3.1 Centralidades de los estudiantes y sus relaciones

En un grafo, los nodos (nodes) representan a los entes relacionados (aquí estudiantes) y las líneas o aristas (edges) representan a las relaciones entre ellos. En este sentido, el SNA contiene una serie de conceptos cuantitativos que tienen como insumo la cantidad y calidad de las relaciones. Algunos de esos conceptos con aplicables para cada nodo (p.e. estudiantes), otros son aplicables para el conjunto de ellos (p.e. comisiones).

En el siguiente gráfico (o grafo más precisamente) se puede observar los estudiantes del último cuatrimestre (2022 - Segundo Cuatrimestre) y las relaciones sobre quien conoce a quien al principio de la cursada.

En este caso, las relaciones se visualizan con líneas. Estas pueden ser tanto relaciones entrantes (“me conocen a mí”) o salientes (“yo conozco a”). Para facilitar la visualización el tamaño de cada estudiante es proporcional a la cantidad de relaciones entrantes que podría considerarse como un indicador grueso de popularidad. En el contexto del SNA este concepto se denomina grado de centralidad (centrality degree).

Otro concepto importante del SNA es el de la intermediación (betweeness centrality). Este puede calcularse tanto para nodos como para las relaciones. En efecto, en el gráfico anterior se visualizó el valor de este concepto para las relaciones (“grado de intermediación”). El criterio que determina el valor es el número de caminos más cortos que pasan a través de ese nodo o relación. La idea de camino más corto es un concepto fuerte del SNA y hace referencia a cual es el “camino” más corto entre un nodo (o relación) y otro nodo (u otra relación) teniendo en cuenta las relaciones existentes. Por ejemplo, hay personas que no son necesariamente populares pero ocupan una posición ventajosa en la red social porque ellos tienen una información que les puede servir a otros. Pensemos en la típica situación en donde necesitamos pedirle un favor a alguien popular pero la unica manera de acceder a él es a través de su secretaria/o. Este última/o puede no ser popular pero tiene un nivel alto de intermediación.

Por último, aplicaremos un concepto del SNA que, intuitivamente, remite a la idea de influencia. Aquí el criterio de esta centralidad es que aquellos nodos que están conectados con otros nodos que, a su turno, están conectados con otros … tienen más influencia que aquellos que están conectados con otros nodos pero que, a su turno, estos no están conectados con nadie. En este sentido, no es lo mismo conocer a 5 personas que son pocos conocidos que conocer a 5 personas que son muy conocidas por otros. Esta es la diferencia principal entre alguien “popular” y un “influencer”. Ejemplo de conceptos del SNA que se acercan a esta intuición pueden considerarse la centralidad del vector propio (eigenvector centrality), la centralidad que se usa en el rankeo de las páginas de google (google page rank) y la centralidad de Katz (katz centrality). Aquí sólo calcularemos la centralidad del propio vector.

Estudiante G. centralidad G. intermediación G. de influencia
LEON, 5 33.00 0.00
EUGEN 5 7.33 1.00
SANDR 4 40.33 0.00
ELIZA 3 18.50 0.87
ANAHÍ 3 2.33 0.87
MICAE 2 8.00 0.00
ANA C 2 0.00 0.00
MARIA 2 51.33 0.00
JORGE 2 9.00 0.00
JULIE 2 40.00 0.00

Como puede observarse en la tabla anterior (sólo se muestran los 10 casos con mayor grado de centralidad), los valores de los diferentes conceptos algunas veces son similares y otras veces no. Esto es razonable ya que cada concepto utiliza un criterio diferente de centralidad. Dada la pluralidad de conceptos de centralidad que existen en el SNA siempre es conveniente explicitar con cual se está trabajando.